工具狂Draw Things特群日报

第 1 版 / 头版

HEADLINE · 09:08 → 22:37 主线报道

前滚石工程师揭行业底牌：不融合AI就是团灭

一场由AI Agent多模型部署分享引发的行业大倒苦水。前滚石音频工程师的现身说法，揭开了传统创意行业五年价格暴跌十几倍的残酷真相，将群友们的焦虑从“AI会不会压价”推向了“我是不是该去开实体店”。在AI重构商业逻辑的今天，有人开始研究小朋友卖猫毛的情绪经济，有人在深夜死磕多模型并发的显存极限。

CAST@追光行业吹哨人@Sade Harder@VOG转型实干家@佑林@曹贼@iK兎Ki@Jam深夜极客@Sade Harder现实提问者

第 2 版 / 简报

09:08 引子

Agent全智能化的技术诱惑

群聊以追光分享几篇关于LLM底层原理、Agent优化和Draw Things的硬核文章开局。此时，他刚刚在测试中摸透了多台电脑部署不同模型协同工作的门道，抛出了一个极具煽动性的观点：单机操作只是换了个AI工具重复劳动，真正的全智能化应该是人只管思考框架创意。这为后续关于“人机融合”的探讨定下了基调。

追光

「Ai真正的实力应该是全智能化，人只需要思考框架创意，才是本质」

— 追光 · 09:08

11:13 激化

AI压价与行业团灭危机

理想有多丰满，现实就有多骨感。Sade的一句“客户拿AI压价”直接刺破了技术滤镜。追光没有回避，直接亮出底牌：作为前滚石音频工程师，他亲历了行业价格五年暴跌十几倍的惨状。他指出，单纯的手搓时代已经接近团灭，只有将传统行业深度经验与AI融合，变成一个“新物种”，才能在客户那里拿到远超10块钱的价值。这番发言在群里引发了强烈的行业焦虑共鸣。

Sade Harder · 追光

「手搓的优势和ai融合后，是一个新的物种」

— 追光 · 11:13

12:21 转折

退守实体与手工的商业逻辑

面对AI的降维打击，讨论方向从“如何用好AI”转向了“如何避开AI”。VOG坦言拼不过AI，正在找店铺准备做热门手工项目集合（如拼豆）。群友们随即展开了一场关于实体商业自救的讨论：从选址的变迁（不选临街选写字楼靠小红书引流），到外卖平台的抽血效应。在技术洪流中，实体体验和情绪价值反而成了某种避风港。

VOG · 佑林

「现在的餐饮被抖音美团那些吸了不少血，不做大优惠不给推流」

— 佑林 · 12:21

17:29 落地

猫毛经济与人类认知红利

从LTX2.3生成的意识流视频，群聊自然过渡到了对现实意识的探讨。曹贼分享女儿在班上卖猫毛一把五毛，VOG提到一年级同学拿咕卡摆摊，这种看似荒诞的小朋友行为，被群友总结为超越认知的“情绪经济”。大家自嘲赚不到认知以外的钱，在AI时代，人类最后的壁垒或许就是这种与生俱来的商业直觉和动手能力。

曹贼 · iK兎Ki · Sade Harder

「赚不到认知以外的钱」

— Sade Harder · 17:29

22:37 收束

Agent多并发的硬核验证

喧嚣散去，深夜的讨论回归了群名的初衷。Jam在测试Agent时发现LM Studio会自动拉起多个模型实例，追光基于这几天的极限测试给出了结论：Agent需要2-8个模型同时运行，极度依赖显存带宽（单Agent需300GB/s，双线需800GB/s）。他还给出了一个非常落地的模型避坑建议，为这场关于AI替代人类的宏大讨论，画上了一个极具实操意味的句号。

Jam · 追光

「想要真正生产力必须要高带宽或者多个机子多个模型协同」

— 追光 · 22:37

第 3 版 / 议题与人物

今日议题

Agent多机部署逻辑

单机运行Agent容易触碰带宽和Swap极限，真正生产力需要多台设备部署不同模型协同指挥。

实体手工店降本引流

避开高租金商圈，将体验类实体店开在住宅楼，依靠美团团购和社交媒体引流成为新解法。

人物索引 · CAST

追光行业吹哨人用滚石背景和腰斩的报价，撕开AI融合的遮羞布

Sade Harder 现实提问者用客户压价和AI抢饭碗的现实问题刺破技术滤镜

VOG 转型实干家果断放弃AI卷生成，转向实体手工店寻找新解法

Jam 深夜极客实测抓出LMS多实例Bug，验证Agent并发极限

实操干货 · INSIGHTS

本地Agent并发运行的硬件真相

运行Agent进行多线程协同任务时，常常需要2-8个模型同时运行。一台Mac想要支撑单Agent基本需求，显存带宽至少需达到300GB/s；若需双线程正常运行，带宽要求飙升至800GB/s。当物理带宽不足时，系统会疯狂使用Swap，一旦Swap达到极限，Mac的内存管理机制会直接清理内存，导致设备出现类似突然断电的黑屏重启。

— 追光

Agent核心驱动模型格式选择

在LM Studio中运行多线程Agent任务时，应首选GGUF格式而非MLX格式。虽然Qwen3.5-9B的MLX-4bit版本在生成速度上比GGUF的Q4_K_M快约1.7倍，但在推演逻辑、计算和代码执行方面的聪明程度不到GGUF的一半。实测中，GGUF格式的9B模型在操作电脑和推演上的表现甚至优于27B的模型。

— 追光

反直觉的低成本实体店选址策略

当下开设手工体验类实体店，核心商圈临街旺铺不再是必选项。更优的策略是将店铺开在租金低廉的写字楼或住宅楼内，将省下的租金成本用于在小红书、抖音进行线上引流，并开通美团团购让消费者通过搜索主动找上门。

— VOG

第 4 版 / 数据与附录

385

总消息

19

发言者

8608

总字数

5

故事节点

4

高光人物

2

问答

可复用 SOP

如何为本地Agent配置高可用模型

→ 打开 LM Studio，在搜索框中输入并下载 Qwen3.5-9B-Q4_K_M.gguf 模型文件。
→ 确保你的设备显存带宽至少在 300GB/s 以上（如 M系列 Max 或 Ultra 芯片）。
→ 在运行 Agent 任务时，监控内存与 Swap 占用率；若需同时开启 2 个以上模型线程，建议采用多台电脑分布式部署，避免单机内存溢出导致系统崩溃。
→ 坚决弃用 MLX 格式模型，避免在复杂推演和代码执行任务中出现逻辑降智。

群内问答 Q&A

为什么AI先生成图/视频/音乐，而不是先从专业的图像/视频/音频编辑工具出来？

— VOG：闭源模型这些都能做到，dt只是用开源模型的一个玩具而已。其实adobe有在做这个事情，正版的ps就可以用ai工具，只是目前他家用的模型能力不行。

qwen3.5-9B-MLX-4bit 和 Qwen3.5-9B-Q4_K_M.gguf 差很多吗？

— 追光：MLX-4bit比gguf快1.7倍，但聪明程度不到后者的一半。如果纯写字没问题，想要推演和计算、代码执行就必须用后者。

工具狂Draw Things特群 · 2026年05月23日 · 04:35 → 02:16
今日 5 条主线 · 385 条消息 · 19 人参演 · 本地出版
本期完 · 明日续